Telegram Group & Telegram Channel
πŸ”₯ Π—Π°Π΄Π°Ρ‡Π°: "ДинамичСская пСрСобучаСмая модСль с ограничСниями Π΄Π°Π½Π½Ρ‹Ρ…"

β–ͺ️ УсловиС Π·Π°Π΄Π°Ρ‡ΠΈ:


Π’Π°ΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ систСму машинного обучСния для ΠΎΠ½Π»Π°ΠΉΠ½-Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΉ, которая Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ. Π”Π°Π½Π½Ρ‹Π΅ ΠΏΠΎΡΡ‚ΡƒΠΏΠ°ΡŽΡ‚ Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½Ρ‹ΠΌ ΠΏΠΎΡ‚ΠΎΠΊΠΎΠΌ Π² Π²ΠΈΠ΄Π΅ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΠΈΡ… дСйствий.

Π”Π°Π½ΠΎ:

- ΠŸΠΎΡ‚ΠΎΠΊ событий Π²ΠΈΠ΄Π°:

{
"user_id": "string",
"event_type": "click" | "view" | "purchase",
"item_id": "string",
"timestamp": "ISO 8601",
"features": {
"device_type": "mobile" | "desktop",
"location": "string",
"time_of_day": "morning" | "afternoon" | "evening" | "night",
"category": "string"
}
}


ВрСбования:

1. ΠŸΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ модСль, которая:
- ΠŸΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ ΠΏΠΎΠΊΡƒΠΏΠΊΠΈ (`purchase`) ΠΏΠΎ ΡΠΎΠ±Ρ‹Ρ‚ΠΈΡŽ view.
- МодСль Π΄ΠΎΠ»ΠΆΠ½Π° динамичСски ΠΎΠ±Π½ΠΎΠ²Π»ΡΡ‚ΡŒΡΡ ΠΏΡ€ΠΈ поступлСнии Π½ΠΎΠ²Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· ΠΏΠΎΠ»Π½ΠΎΠ³ΠΎ пСрСобучСния с нуля.
- ΠŸΡ€ΠΈ этом историчСскиС Π΄Π°Π½Π½Ρ‹Π΅ ΡƒΠ΄Π°Π»ΡΡŽΡ‚ΡΡ Ρ‡Π΅Ρ€Π΅Π· 24 часа (Π΄Π°Π½Π½Ρ‹Π΅ "ΠΆΠΈΠ²ΡƒΡ‚" Ρ‚ΠΎΠ»ΡŒΠΊΠΎ сутки).

2. Π’Π½Π΅Π΄Ρ€ΠΈΡ‚ΡŒ ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌ:
- ΠžΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΡ Π΄Ρ€Π΅ΠΉΡ„Π° Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· доступа ΠΊ старым Π΄Π°Π½Π½Ρ‹ΠΌ.
- АвтоматичСского пСрСзапуска пСрСобучСния ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠΈ сущСствСнного Π΄Ρ€Π΅ΠΉΡ„Π°.

3. ΠžΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΡ:
- Π’Ρ‹ Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Ρ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½Π° событий Π² ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ памяти.
- Latency прСдсказания ΠΌΠΎΠ΄Π΅Π»ΠΈ β€” Π½Π΅ Π±ΠΎΠ»Π΅Π΅ 100 миллисСкунд.

---

β–ͺ️ ## Подсказки:

- ΠŸΠΎΠ΄ΡƒΠΌΠ°ΠΉΡ‚Π΅ ΠΏΡ€ΠΎ использованиС on-line learning ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, SGDClassifier с partial_fit Π² sklearn, ΠΈΠ»ΠΈ свои Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ).
- Для отслСТивания Π΄Ρ€Π΅ΠΉΡ„Π° Π±Π΅Π· хранСния ΠΏΠΎΠ»Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ:
- Бтатистики ΠΏΠΎ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌ (ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ ΠΎΠΊΠ½Π°, гистограммы, PSI / KL-Π΄ΠΈΠ²Π΅Ρ€Π³Π΅Π½Ρ†ΠΈΡŽ).
- ΠœΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³ распрСдСлСний Ρ‡Π΅Ρ€Π΅Π· ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ.
- Для Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΏΠΎΠ΄ΡƒΠΌΠ°ΠΉΡ‚Π΅ ΠΎΠ± очСрСдях сообщСний ΠΈ микросСрвисной Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π΅.
- Π’ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, стоит Ρ€Π°ΡΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ feature hashing для ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡ΠΈΡ‚ΡŒ Ρ€Π°Π·ΠΌΠ΅Ρ€ пространства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

---

β–ͺ️ ## Π§Ρ‚ΠΎ оцСниваСтся:

- Π£ΠΌΠ΅Π½ΠΈΠ΅ Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ обучСния ΠΏΠΎΠ΄ ограничСния Π·Π°Π΄Π°Ρ‡ΠΈ.
- Навыки построСния систСм с ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠ΅ΠΌ ΠΏΠΎ памяти ΠΈ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΎΡ‚Π²Π΅Ρ‚Π°.
- Π‘ΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ Π΄Π΅Ρ‚Π΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π΄Ρ€Π΅ΠΉΡ„ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎ Π½Π° Π½Π΅Π³ΠΎ Ρ€Π΅Π°Π³ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ.
- Чистота ΠΈ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΡŒ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρ‹.
- ПониманиС особСнностСй ΠΏΡ€ΠΎΠ΄Π°ΠΊΡˆΠ½-ML систСм.

---

β–ͺ️ ## Π Π°Π·Π±ΠΎΡ€ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΠ³ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ:

**АрхитСктура Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ:**

- Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ½Π»Π°ΠΉΠ½-модСль (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, SGDClassifier, Vowpal Wabbit, ΠΈΠ»ΠΈ свою Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ логистичСской рСгрСссии).
- Для ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ feature hashing (Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ роста количСства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ²).
- ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Ρ‚ΡŒ "ΠΆΠΈΠ²ΠΎΠΉ" Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ Π±ΡƒΡ„Π΅Ρ€ Π² ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ памяти:
- Π₯Ρ€Π°Π½ΠΈΡ‚ΡŒ послСдниС N событий (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½) с рСгулярным ΡƒΠ΄Π°Π»Π΅Π½ΠΈΠ΅ΠΌ ΡƒΡΡ‚Π°Ρ€Π΅Π²ΡˆΠΈΡ… записСй (TTL).
- Для отслСТивания Π΄Ρ€Π΅ΠΉΡ„Π°:
- Π‘Π»Π΅Π΄ΠΈΡ‚ΡŒ Π·Π° срСдними значСниями ΠΈΠ»ΠΈ частотами ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΉ.
- ΠŸΡ€ΠΈ Ρ€Π΅Π·ΠΊΠΈΡ… измСнСниях β€” Ρ‚Ρ€ΠΈΠ³Π³Π΅Ρ€ΠΈΡ‚ΡŒ ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ с нуля.

ΠŸΡ€ΠΎ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ слоТности:

- ΠžΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° "Ρ…ΠΎΠ»ΠΎΠ΄Π½ΠΎΠ³ΠΎ старта" ΠΏΡ€ΠΈ ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Π½ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π±Π΅Π· большого объСма Π΄Π°Π½Π½Ρ‹Ρ….
- Как ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ пСрСобучСния Π½Π° ΡˆΡƒΠΌ ΠΏΡ€ΠΈ частом ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ.
- Баланс ΠΌΠ΅ΠΆΠ΄Ρƒ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒΡŽ Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΈ качСством ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ ΠΎΡ‡Π΅Π½ΡŒ частом ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠΈ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

Π˜Π½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ ΠΏΠΎΠΌΠΎΡ‡ΡŒ:

- Π‘ΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ гистограммы для ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² (`histogram_sketching`).
- Feature hashing (`HashingVectorizer`, `FeatureHasher`).
- ΠœΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΡ‹ ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ обучСния (`partial_fit`, warm_start ΠΌΠΎΠ΄Π΅Π»ΠΈ).
- ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ для ΠΌΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³Π° Π΄Ρ€Π΅ΠΉΡ„Π°: Population Stability Index (PSI), JS/ KL дивСргСнция.

Π”Π΅Π»ΠΈΡ‚Π΅ΡΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ΠΌ Π² коммСнтариях πŸ‘‡

@machinelearning_interview

#собСсСдованиС #Π·Π°Π΄Π°Ρ‡Π° #ΠΌΠ°ΡˆΠΈΠ½Π½ΠΎΠ΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅
Please open Telegram to view this post
VIEW IN TELEGRAM



tg-me.com/machinelearning_interview/1772
Create:
Last Update:

πŸ”₯ Π—Π°Π΄Π°Ρ‡Π°: "ДинамичСская пСрСобучаСмая модСль с ограничСниями Π΄Π°Π½Π½Ρ‹Ρ…"

β–ͺ️ УсловиС Π·Π°Π΄Π°Ρ‡ΠΈ:


Π’Π°ΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ систСму машинного обучСния для ΠΎΠ½Π»Π°ΠΉΠ½-Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΉ, которая Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ. Π”Π°Π½Π½Ρ‹Π΅ ΠΏΠΎΡΡ‚ΡƒΠΏΠ°ΡŽΡ‚ Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½Ρ‹ΠΌ ΠΏΠΎΡ‚ΠΎΠΊΠΎΠΌ Π² Π²ΠΈΠ΄Π΅ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΠΈΡ… дСйствий.

Π”Π°Π½ΠΎ:

- ΠŸΠΎΡ‚ΠΎΠΊ событий Π²ΠΈΠ΄Π°:


{
"user_id": "string",
"event_type": "click" | "view" | "purchase",
"item_id": "string",
"timestamp": "ISO 8601",
"features": {
"device_type": "mobile" | "desktop",
"location": "string",
"time_of_day": "morning" | "afternoon" | "evening" | "night",
"category": "string"
}
}


ВрСбования:

1. ΠŸΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ модСль, которая:
- ΠŸΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ ΠΏΠΎΠΊΡƒΠΏΠΊΠΈ (`purchase`) ΠΏΠΎ ΡΠΎΠ±Ρ‹Ρ‚ΠΈΡŽ view.
- МодСль Π΄ΠΎΠ»ΠΆΠ½Π° динамичСски ΠΎΠ±Π½ΠΎΠ²Π»ΡΡ‚ΡŒΡΡ ΠΏΡ€ΠΈ поступлСнии Π½ΠΎΠ²Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· ΠΏΠΎΠ»Π½ΠΎΠ³ΠΎ пСрСобучСния с нуля.
- ΠŸΡ€ΠΈ этом историчСскиС Π΄Π°Π½Π½Ρ‹Π΅ ΡƒΠ΄Π°Π»ΡΡŽΡ‚ΡΡ Ρ‡Π΅Ρ€Π΅Π· 24 часа (Π΄Π°Π½Π½Ρ‹Π΅ "ΠΆΠΈΠ²ΡƒΡ‚" Ρ‚ΠΎΠ»ΡŒΠΊΠΎ сутки).

2. Π’Π½Π΅Π΄Ρ€ΠΈΡ‚ΡŒ ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌ:
- ΠžΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΡ Π΄Ρ€Π΅ΠΉΡ„Π° Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· доступа ΠΊ старым Π΄Π°Π½Π½Ρ‹ΠΌ.
- АвтоматичСского пСрСзапуска пСрСобучСния ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠΈ сущСствСнного Π΄Ρ€Π΅ΠΉΡ„Π°.

3. ΠžΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΡ:
- Π’Ρ‹ Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Ρ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½Π° событий Π² ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ памяти.
- Latency прСдсказания ΠΌΠΎΠ΄Π΅Π»ΠΈ β€” Π½Π΅ Π±ΠΎΠ»Π΅Π΅ 100 миллисСкунд.

---

β–ͺ️ ## Подсказки:

- ΠŸΠΎΠ΄ΡƒΠΌΠ°ΠΉΡ‚Π΅ ΠΏΡ€ΠΎ использованиС on-line learning ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, SGDClassifier с partial_fit Π² sklearn, ΠΈΠ»ΠΈ свои Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ).
- Для отслСТивания Π΄Ρ€Π΅ΠΉΡ„Π° Π±Π΅Π· хранСния ΠΏΠΎΠ»Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ:
- Бтатистики ΠΏΠΎ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌ (ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ ΠΎΠΊΠ½Π°, гистограммы, PSI / KL-Π΄ΠΈΠ²Π΅Ρ€Π³Π΅Π½Ρ†ΠΈΡŽ).
- ΠœΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³ распрСдСлСний Ρ‡Π΅Ρ€Π΅Π· ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ.
- Для Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΏΠΎΠ΄ΡƒΠΌΠ°ΠΉΡ‚Π΅ ΠΎΠ± очСрСдях сообщСний ΠΈ микросСрвисной Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π΅.
- Π’ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, стоит Ρ€Π°ΡΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ feature hashing для ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡ΠΈΡ‚ΡŒ Ρ€Π°Π·ΠΌΠ΅Ρ€ пространства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

---

β–ͺ️ ## Π§Ρ‚ΠΎ оцСниваСтся:

- Π£ΠΌΠ΅Π½ΠΈΠ΅ Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ обучСния ΠΏΠΎΠ΄ ограничСния Π·Π°Π΄Π°Ρ‡ΠΈ.
- Навыки построСния систСм с ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠ΅ΠΌ ΠΏΠΎ памяти ΠΈ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΎΡ‚Π²Π΅Ρ‚Π°.
- Π‘ΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ Π΄Π΅Ρ‚Π΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π΄Ρ€Π΅ΠΉΡ„ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎ Π½Π° Π½Π΅Π³ΠΎ Ρ€Π΅Π°Π³ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ.
- Чистота ΠΈ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΡŒ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρ‹.
- ПониманиС особСнностСй ΠΏΡ€ΠΎΠ΄Π°ΠΊΡˆΠ½-ML систСм.

---

β–ͺ️ ## Π Π°Π·Π±ΠΎΡ€ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΠ³ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ:

**АрхитСктура Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ:**

- Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ½Π»Π°ΠΉΠ½-модСль (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, SGDClassifier, Vowpal Wabbit, ΠΈΠ»ΠΈ свою Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ логистичСской рСгрСссии).
- Для ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ feature hashing (Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ роста количСства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ²).
- ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Ρ‚ΡŒ "ΠΆΠΈΠ²ΠΎΠΉ" Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ Π±ΡƒΡ„Π΅Ρ€ Π² ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ памяти:
- Π₯Ρ€Π°Π½ΠΈΡ‚ΡŒ послСдниС N событий (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½) с рСгулярным ΡƒΠ΄Π°Π»Π΅Π½ΠΈΠ΅ΠΌ ΡƒΡΡ‚Π°Ρ€Π΅Π²ΡˆΠΈΡ… записСй (TTL).
- Для отслСТивания Π΄Ρ€Π΅ΠΉΡ„Π°:
- Π‘Π»Π΅Π΄ΠΈΡ‚ΡŒ Π·Π° срСдними значСниями ΠΈΠ»ΠΈ частотами ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΉ.
- ΠŸΡ€ΠΈ Ρ€Π΅Π·ΠΊΠΈΡ… измСнСниях β€” Ρ‚Ρ€ΠΈΠ³Π³Π΅Ρ€ΠΈΡ‚ΡŒ ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ с нуля.

ΠŸΡ€ΠΎ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ слоТности:

- ΠžΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° "Ρ…ΠΎΠ»ΠΎΠ΄Π½ΠΎΠ³ΠΎ старта" ΠΏΡ€ΠΈ ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Π½ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π±Π΅Π· большого объСма Π΄Π°Π½Π½Ρ‹Ρ….
- Как ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ пСрСобучСния Π½Π° ΡˆΡƒΠΌ ΠΏΡ€ΠΈ частом ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ.
- Баланс ΠΌΠ΅ΠΆΠ΄Ρƒ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒΡŽ Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΈ качСством ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ ΠΎΡ‡Π΅Π½ΡŒ частом ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠΈ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

Π˜Π½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ ΠΏΠΎΠΌΠΎΡ‡ΡŒ:

- Π‘ΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ гистограммы для ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² (`histogram_sketching`).
- Feature hashing (`HashingVectorizer`, `FeatureHasher`).
- ΠœΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΡ‹ ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ обучСния (`partial_fit`, warm_start ΠΌΠΎΠ΄Π΅Π»ΠΈ).
- ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ для ΠΌΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³Π° Π΄Ρ€Π΅ΠΉΡ„Π°: Population Stability Index (PSI), JS/ KL дивСргСнция.

Π”Π΅Π»ΠΈΡ‚Π΅ΡΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ΠΌ Π² коммСнтариях πŸ‘‡

@machinelearning_interview

#собСсСдованиС #Π·Π°Π΄Π°Ρ‡Π° #ΠΌΠ°ΡˆΠΈΠ½Π½ΠΎΠ΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

BY Machine learning Interview


Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283

Share with your friend now:
tg-me.com/machinelearning_interview/1772

View MORE
Open in Telegram


Machine learning Interview Telegram | DID YOU KNOW?

Date: |

The STAR Market, as is implied by the name, is heavily geared toward smaller innovative tech companies, in particular those engaged in strategically important fields, such as biopharmaceuticals, 5G technology, semiconductors, and new energy. The STAR Market currently has 340 listed securities. The STAR Market is seen as important for China’s high-tech and emerging industries, providing a space for smaller companies to raise capital in China. This is especially significant for technology companies that may be viewed with suspicion on overseas stock exchanges.

Telegram today rolling out an update which brings with it several new features.The update also adds interactive emoji. When you send one of the select animated emoji in chat, you can now tap on it to initiate a full screen animation. The update also adds interactive emoji. When you send one of the select animated emoji in chat, you can now tap on it to initiate a full screen animation. This is then visible to you or anyone else who's also present in chat at the moment. The animations are also accompanied by vibrations. This is then visible to you or anyone else who's also present in chat at the moment. The animations are also accompanied by vibrations.

Machine learning Interview from ca


Telegram Machine learning Interview
FROM USA